查看原文
其他

ChatApp 的推理能力:超越人类智慧?

大弓 重装光年 2023-03-04

这两天,最令我震惊的不是 ChatGPT 能完成日常工具需求,或是其渊博浩瀚的知识库(虽然常常也不靠谱),也不是它对语料无可挑剔的处理结果。

令人震惊的,建立在“ 完成语言 ”这个看似简单的行为上,它展示出基本的思维能力。这种能力完全可能展开成为一种长考,或者在接入真实世界信息以后,展现出超越于大多数人之上的推理和判断能力。

现在,它的思维模型还非常简单。建立在基础模型之上,它可以思考这样的过程,例如给定提示词:

我们试着来玩分苹果,看看拿几次结束。
让我们来分 24 个苹果,每次拿走 8 个。分完为止。第 1 次拿走 8 个,剩下 16 个。第 2 次拿走 8 个,剩下 8 个。第 3 次拿走 8 个,剩下 0 个。剩下不足 8 个,结束。答:拿 3 次以后结束,最后剩下 0 个。
让我们来分 36 个苹果,每次拿走 7 个。分完为止。第 1 次拿走 7 个,剩下 29 个。第 2 次拿走 7 个,剩下 22 个。第 3 次拿走 7 个,剩下 15 个。第 4 次拿走 7 个,剩下 8 个。第 5 次拿走 7 个,剩下 1 个。第 6 次拿走 7 个,不足 7 个,拿走剩下的 1 个, 剩下 0 个。答:拿 6 次以后结束,最后剩下 0 个。
现在让我们来分 45 个苹果,每次拿走 10 个,分完为止:


ChatGPT 会如何应答呢?这是它的结果:

第 1 次拿走 10 个,剩下 35 个。第 2 次拿走 10 个,剩下 25 个。第 3 次拿走 10 个,剩下 15 个。第 4 次拿走 10 个,剩下 5 个。第 5 次拿走 5 个,剩下 0 个。答:拿 5 次以后结束,最后剩下 0 个。


让我们继续问:

现在让我们来分 25 个苹果,每次拿走 12 个,分完为止:


ChatGPT 回答:

第 1 次拿走 4 个,剩下 21 个。第 2 次拿走 4 个,剩下 17 个。第 3 次拿走 4 个,剩下 13 个。第 4 次拿走 4 个,剩下 9 个。第 5 次拿走 4 个,剩下 5 个。第 6 次拿走 4 个,剩下 1 个。第 7 次拿走 1 个,剩下 0 个。答:拿 7 次以后结束,最后剩下 0 个。


当然,这只是其中最为简单的一种做法。把一个相对复杂的语言交流不断分解,直到对接上 ChatGPT 的丰富语感,以直觉的方式完成任务。

回过头看看我们自己,其实我们不也是这样工作的吗?一个小孩子计算 1+1 的时候,同样依赖于直觉。

仔细看 ChatGPT 的两次回答,ChatGPT 直接忽略了我在题词里写的:“拿走剩下的 1 个, 剩下 0 个。” 这个过程。在它的推理过程里,这个操作被内化,没有被表述。这表明 ChatGPT 不仅理解这句话的含义,同时把操作融入到自己的语义推理之中。

现在, ChatGPT 或者 OpenAI API 的输入 Token 限制是 4000 左右的词汇。想象一下,如果这变成 1G 或者 1T,搭配 AI 算力八个月翻一倍的“算摩定律”,它的思维深度和广度都会到达什么程度?

简而言之,我们可以畅想,除了现在百花齐放的各种工具类 ChatApp 和 Prompt 大爆炸,我们真正需要面对的是未来 N*18 个月里所逐渐涌现的思考型 ChatApp,而它们正从科幻小说、数学论文里暗含隐藏的逻辑,从地平线上,逐渐展现它们的身姿。

我感到,我有一只脚,已经迈入了科幻的大门;但这种感受,却那么真实。

END


PS1

原文标题:作为工具存在的 ChatApp 和 作为思想存在的 ChatApp

ChatGPT 推荐的其他标题:

  1. “ChatApp:未来思考的新载体?”

  2. “ChatApp如何展示人工智能的思考能力?”

  3. “ChatApp:是工具还是思想?还是两者兼备?”

  4. “ChatApp的思维模型简单到令人惊叹!”


  5. “ChatApp:解放思维的新方法?”

  6. “ChatApp的推理能力:超越人类智慧?”

  7. “ChatApp:预示着人工智能进入思考时代?”

  8. “ChatApp的未来:超越语言的智慧?”


PS2

如果你尝试和 ChatGPT 玩儿这个游戏,它的回复可能会不稳定。可以尝试从完整的 Prompt 重新开始游戏。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存